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Модель межмасштабного пространства 
кривизны для представления формы 
геометрических объектов 


Предлагается модель межмасштабного пространства кривизны для представления формы контуров 
геометрических объектов, которая в отличие от известных моделей масштабно-пространственного 
представления отображает выпуклые признаки формы в масштабном пространстве за счет введения 
межмасштабного проецирования, что позволяет значительно расширить класс объектов, распознаваемых с 
ПОМОЩЬЮ масштабно-пространственных представлений. 


Введение 


Разработка информативного представления формы (дескриптора формы) 
геометрических объектов является одной из основных задач при построении систем 
распознавания геометрических объектов по форме. При возникновении задач 
представления и распознавания формы геометрических объектов были выдвинуты 
следующие необходимые требования к дескрипторам формы: инвариантность к 
перемещению, масштабированию и повороту. В рамках разработки стандарта 
«Интерфейс представления мультимедийных данных» группой экспертов МРЕС 
(Моуше Расвиге'5 Ехрейз Отопр), больше известного под названием МРЕС-7, были 
выдвинуты новые критерии оценки представлений формы: инвариантность, устой- 
чивость, компактность, вычислительная простота формирования, возможность и 
вычислительная сложность сравнения. 

Представление формы геометрических объектов в виде масштабного пространства 
кривизны (МПК) — дескриптор С$$ - является одним из четырех успешно 
прошедших официальные испытания в рамках разработки стандарта МРЕС-7. 
Именно этот дескриптор наиболее полно отображает локальные признаки формы. 
Проблемой дескриптора в плане представления локальных признаков является лишь 
отсутствие возможности отражения выпуклых признаков формы, что, собственно, и 
является основной причиной исключительно локальной ориентации этого дескриптора. 

В данной статье анализируется традиционная модель масштабно-пространст- 
венного представления формы геометрических объектов и ее модификация на основе 
проецирования на окружность с последующим формированием дуального набора 
признаков, позволяющая в некоторых случаях добиться отображения выпуклых 
признаков формы, а также разработанная модель межмасштабного проецирования, 
позволяющая наиболее полно отображать все выпуклые и вогнутые признаки формы 
геометрических объектов на одном наборе признаков. 

Статья организована следующим образом. В первой главе приводится описание 
исходной модели масштабно-пространственного представления кривизны (МПК), 
построение изображений МПК и анализ достоинств и недостатков такого 
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представления. Во второй главе рассматривается модификация МПК на основе 
введения дуального изображения МПК путем проецирования на окружность и 
анализ этого решения проблемы традиционной модели МПК. В третьей главе 
описывается предлагаемая модель межмасштабного пространства кривизны, 
позволяющая за счет межмасштабного проецирования добиться наиболее полного 
отображения выпуклых признаков. В четвертой главе рассматриваются некоторые 
аспекты практического применения предлагаемой модели для распознавания 
образов геометрических объектов. 


1 Модель масштабно-пространственного 
представления формы 


Теория многомасштабного представления измеренного сигнала была предложена 
Виткином (1983) и одновременно Коэндериком (1984). Методология предполагает 
отображение сигнала на однопараметрическое семейство полученных масштабов — 
масштабное пространство (МП). Параметром в этом случае является так называемый 


масштабный параметр Е К ‚ , необходимый для определения некоторого масштаб- 


ного уровня (В, — множество действительных чисел, а К, \{0} — соответствующее 


множество без нуля). Рассмотрим, как формулируется масштабно-пространственное 
представление для непрерывного сигнала (в одномерном случае) [1]. 

Определение 3.1. Для сигнала [:Ю —› ® масштабно-пространственное 
представление 2: В хК, —> К определено так, что отображение сигнала на нулевом 


уровне эквивалентно исходному сигналу, а отображение на более грубых масштабах 
выражается конволюцией исходного сигнала гауссовыми ядрами возрастающей 


ширины. 
[х;0) = Г (х), [Кх;о) = 2(х;0) * Г(х), (1) 
где Г/(х;0) — отображение сигнала на нулевом уровне; 


[(х; 0) — отображение сигнала на более грубых масштабах о. 


В форме неявных интегралов результат операции конволюции «*» записывается 
в виде: 


Ыхзо)= |” а(о)/(х- 94, 


где: К- К, \ {0} —› В является Гауссовым ядром (одномерным) [1]. 


Причем доказано, что именно Гауссово МП — единственное непрерывное 
линейное МП, удовлетворяющее всем необходимым требованиям: линейность 
(в отношении умножения), инвариантность к сдвигу, масштабная инвариантность, 
свойство полугруппы, свойство положительности. 

Представляя контур замкнутой области некоторого объекта в параметрическом 
виде и учитывая, что контур замкнутой области является замкнутой кривой, можно 
представить кривую Г с помощью параметра, нормализующего длину дуги 


Г= (жи), ум) [и [9,1}. (2) 
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Для формулировки масштабно-пространственного представления кривизны 
контура замкнутой области, представленного кривой в параметрической форме, 
вводят понятие развития кривой, которая достигается вычислением кривизны 
контура на различных масштабах (сглаженной Гауссовой функцией с дб, соответст- 
вующими масштабу). 

Х(и,о) = х(и)* 8(и,о), У(и,о) = у(и) * &(и,о). 

Согласно свойствам конволюции, производные каждого компонента могут быть 
легко вычислены: 

Х, (и.о) =х(и)х 8 (и,б), Х „(и,о)=х(и)*е(и,о). (3) 

Точно так же определяются У(и,о), и У(и,б)„. Поскольку точные формулы 
для © (и.о) и 8 „(и,0) известны, кривизну развивающейся кривой можно легко 


вычислить [2]: 


Х,(и,с)7 (и.о) —Х (и, с)У (и,в) 


(Х, (и, в)" + У, (и,о)°)"" 


При увеличении © изменяется форма Г.. Этот процесс формирования 


К(и,о) = (4) 


упорядоченной последовательности кривых называется развитием Г. Рассматривая 
Г, не трудно определить положение точек перехода через ноль для Г., начиная с 


о = | и увеличивая на некоторое Ло’ на каждом уровне масштаба (рис. 1). 


—— 


Рисунок 1 — Сглаживание кривой при развитии и уменьшение количества точек 
перехода через ноль при в =1,4,7,10,12,14 


Если определить положения точек перехода кривизны через ноль каждой Г. при 


развитии, можно отобразить результирующие точки на плоскости (и,0), где и -— 


нормированная длина дуги, а б — ширина Гауссова ядра [3]. Результат можно 
отобразить в виде бинарного изображения — изображения масштабного пространства 
кривизны (МПК) кривой (рис. 3, 4). Пересечение каждой горизонтальной линии 
контурами МПК отмечает положение точек перехода через ноль соответствующей 
кривой Г’. 

Очевидно, что изображение МПК нормированной кривой является инвариант- 
ным к аффинным искажениям и устойчиво к помехам. Поворот объекта обычно 
вызывает циклический сдвиг МПК (рис. 2а, 26). Точно такое же влияние имеет 
изменение начальной точки контура. Благодаря нормализации масштабирование не 
влияет на вид МПК, а на рис.2в видно, что помехи производят появление 
небольших дуг на низких уровнях о, но никак не влияют на основные дуги. 
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Эти качества МПК используют для эффективного представления и распознавания 
формы геометрических объектов. Необходимо отметить, что для идентификации 
формы не требуется все изображение МПК, а только максимумы дуг. Набор 
максимумов в виде пар и составляет дескриптор С$$ (Сигуавте Зсае-Зрасе — 
масштабного пространства кривизны, далее — МПК), выбранный в качестве одного 
из основных дескрипторов формы в рамках стандарта МРЕС-7. 


х ЛНы 
5 


у 


маи. 


» 


Рисунок 2 — Кривые контуров и соответствующие изображения МПК: 
а-— исходный контур, 6 — влияние поворота, в — влияние помех 


Однако, несмотря на все достоинства, этот подход обладает одним недостатком — 
отсутствие возможности отражения даже сильно выраженных выпуклых признаков 
формы, т.к. выпуклые сегменты не имеют точек перехода кривизны через ноль. 
Очевидно, что введение выпуклых признаков в дескриптор МПК либо модификация 
процесса формирования дескриптора позволит значительно расширить класс распоз- 


наваемых объектов. 


2 Дуальная модель масштабно-пространственного 
представления формы 


Попытка введения выпуклых признаков в дескриптор МПК была сделана Копфом 
в 2005 с помощью проецирования кривых Г’. на описывающую окружность [4]. 


Для проецирования кривых Г. на окружность, кривая вписывается в окруж- 


ность радиуса К и каждая точка кривой проецируется на ближайшую точку 
окружности Р. Пример проецирования на окружность кривой с сильно выражен- 
ными выпуклыми признаками (углами) представлена на рис. 3. Выпуклые сегменты 
исходной кривой в результате проецирования становятся вогнутыми сегментами 
проецированной кривой. Вычисление проецированной кривой достаточно просто. 
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Точки (х(и), у(и)) исходной замкнутой кривой проецируются в точки с другими 
Г Г ь 
координатами (х (и), у (и)). Координаты центра описывающей окружности 


(М‚,М,) с радиусом К вычисляются как средние координат точек кривой. 


Рисунок 3 — Проецирование кривой на окружность 


Непосредственно проецирование выполняется по следующим формулам: 


В — \/м, = х(и))’ НЕ (М, 5 У(и)у > (5) 
/ 2-Е а у(и) 
х (и) = (х(и)-М,). РЕМ (6) 
Визу 
! 2 К Био 
о а, (7) 
х(и),у(и) 
ле 0„„„ - Расстояние между центром (М,,М,) и точками (х(и), у(и)) 
кривой. 


В дискретном случае, если точка совпадает по координатам с центром, 
координаты ее проекции определяются как средние между координатами проекций 
двух соседних точек. 


гокх ц\ус 


а 
Рисунок 4 — Дуальное МПК выпуклых и вогнутых символов текста: 
а удачное дуальное МПК, 6 -— недостаток дуального МПК (дуги центрированы, 
что не влияет на представление, но более наглядно) 
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Построение МПК спроецированной кривой не отличается от построения МПК 
обычной кривой кроме знака. Таким образом, в результате построения МПК 
исходной кривой и ее проекции получают дуальное изображение МПК (рис. 4а). 

Из рис. 4а видно, что такое дуальное представление МПК более полно отобра- 
жает признаки формы геометрических объектов по сравнению с исходным МПК, так 
как в негативной части дуального МПК отражаются наиболее выраженные 
выпуклые признаки формы, тогда как в исходном МПК выпуклые признаки вообще 
отсутствуют. Однако также можно заметить, что это представление является из- 
быточным, так как вогнутые сегменты исходной кривой отображаются в вогнутые на 
спроецированной кривой. 

Кроме того, такое отображение не способно в достаточной мере различить 
степень выгнутости выпуклых признаков. Это можно легко показать на примере 
символов текста, для распознавания которых, как ни странно, применение дуального 
МПК рекомендовано (рис. 46). На приведенном на рисунке примере проецирование 
контуров символов на окружность не дает ожидаемого эффекта, поскольку проекция 
мало отличается от исходного контура либо от других проекций. Еще одним 
недостатком дуального представления на основе проецирования на окружность 
является возникновение петель в некоторых (иногда значимых) участках контура 
из-за несоответствия формы кривых контура понятию округлости. При этом такие 
участки не отображаются на дуальном МПК. 

Таким образом, проблема отображения выпуклых признаков в МПК остается 
открытой. 


3 Межмасштабное пространство кривизны 


Метод проецирования кривой на более примитивную, в смысле детализации, 
кривую, рассмотренный на примере окружности выше, имеет одну очень полезную 
особенность — представление исходной кривой таким образом, что выпуклые 
признаки проецируются в вогнутые. Эта особенность проявляется не во всех 
случаях, поскольку в качестве кривой проецирования выбрана фиксированная 
замкнутая кривая — окружность. Очевидно, ни одна фиксированная кривая, ввиду 
разнообразия форм геометрических объектов, не может дать адекватного (в смысле 
отображения выпуклых признаков в вогнутые) проецирования. 

Предлагается масштабно-пространственное представление кривизны, построенное 
на основе развития кривой контура, спроецированной на кривую более высокого 
уровня (более округлой). Такой подход позволяет отобразить все множество 
выпуклых признаков на множество вогнутых признаков, исключая необходимость 
применения фиксированной кривой. 

Как и ранее, представляем кривую контура Г с помощью параметра, 
нормализующего длину дуги (2). Представление кривой на различных уровнях 
масштаба о осуществляется развитием кривой путем конволюции Гауссовой 
функцией ©(и,о) в соответствии с (3). 


Для формулировки представления кривизны контура замкнутой области в 
межмасштабном пространстве введем понятие межмасштабного проецирования, при 


котором на каждом уровне масштаба о кривая Г, проецируется на представление 


> > ГА 
этой кривой на более высоком уровне Г.,,, в кривую Г.” в соответствии со 


следующей формулой. 


ХХ“ (и.о) =—Х(и, 0) + Бх(и,с), У“(и,о) =-У(и, о) + Бу(и,в), 
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где Ох(и,о) и Оу(и,с) - компоненты вектора Б= (Ох(и, о), Ду(и,с)), с 
началом в точке (Х(и,о),У(и,о)) и концом в точке (Х(и,с +Ло), (и.о -До)), 
которые могут быть легко вычислены по формулам: 

Эх(и,о) = Х(и,о) — Х(и,о +Ло), Бу(и, в) = Т(и, о) — У(и,о +Ло). 


Таким образом, спроецированная кривая может быть представлена в парамет- 
рическом виде следующим образом: 


Х“° (и, в) =—х(и)* 2 (и, в) +2-х(и)* ®(и, с +Лд), 


У“ (и,о) =—у(и)х ®(и, 0) +2: у(и)* (и, о + До). _ 


По аналогии с формулой (4) определяем значение кривой в межмасштабном 
пространстве как: 


Х "(и.о)" (и.о) — Х“"(и, о)" (и, в) 


(Х*° (и, в) а У“ (и, о)’ 


где Х^”, Уи Х.”,У-” определяются по формуле (9) при подстановке ©, (и,0) и 


ии 2 ии 


К(и,о) = (9) 


2„(и,о) вместо &(и,0`) соответственно. 


Формула (9) позволяет определить значение кривизны в каждой точке меж- 
масштабного пространства кривизны (ММПК). 

Пример проецирования кривой контура квадрата на соответствующее пред- 
ставление на более высоком уровне показан на рис. 5. 


Б=<Фх.Оу) 


Рисунок 5 — Межмасштабное проецирование кривой контура квадрата (Ло = 20) 


Внешний контур представляет кривую на уровне о = 0, средний — кривую на 
уровне о = 20, а внутренний — соответствующая спроецированная кривая. Очевидно, 


межмасштабное проецирование кривой Г’, позволяет преобразовать выпуклые признаки 


в вогнутые на каждом уровне масштаба. 
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4 Аспекты практического применения 
межмасштабного проецирования 


Построение изображения ММПК ничем не отличается от построения МПК. 


до 
При увеличении ©’изменяется форма Г’, а соответственно и форма Г”. Не трудно 


А 
определить положение точек перехода через ноль для Г” с помощью формулы (9), 


начиная с о=| и увеличивая на каждом уровне масштаба. При увеличении © и 
постепенном сглаживании исходной кривой сглаживается и проецированная кривая, 
а соответственно количество точек перехода через ноль уменьшается до тех пор, 


А > > 
пока кривая Г” не станет выпуклои, т.е. не останется ни однои точки перехода 


через ноль на проецированной кривой. Для наглядности приведем изображения 
МПК и ММИК одной кривой при повороте и наличии искажений (рис. 6). 
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Рисунок 6 — Кривые контуров и соответствующие изображения МПК и ММПК 


На рис. 6 видно, что выпуклый признак головы рыбы отображается отдельной 
дугой на ММПК (и =150) и не имеет отображения на МПК. Кроме того, следует 
заметить, что дуги изображения ММПК могут иметь совершенно иную форму, 
нежели дуги МПК. Появляются точки, которые можно назвать точками обратного 
максимума (для дуг, имеющих эллиптическую форму, и = 90), а также точками 
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локальных минимумов (и = 190). Исследуя поведение дуг ММПК при изменении 
Ло, можно заметить, что точки локального минимума появляются вследствие 
слияния двух дуг, поэтому их включение в набор признаков дескриптора может 
повлечь возникновение ошибок при распознавании и, следовательно, не является 
эффективным. 

Исследуя возникновение и значимость эллиптических дуг при построении 
ММПК, можно заключить, что учет положения точек обратного максимума может 
иметь решающее значение при распознавании (рис. 7). 
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Рисунок 7 — Различие ММПК сходных по строению символов текста 


Рассматривая изображения МПК (рис. 4а, верхний набор), дуального МПК 
(рис. 4а, верхний и нижний наборы) и ММПК (рис. 7) букв «Ц», «У» и «С» латинского 
алфавита, можно заключить, что межмасштабно-пространственное представление 
кривизны замкнутых кривых обеспечивает наиболее полное отображение локальных 
признаков формы геометрических объектов. Это создает предпосылки создания более 
адекватного дескриптора формы и, следовательно, более эффективных методов 
распознавания геометрических объектов по признакам формы. 


Заключение 


Анализ традиционного метода построения масштабно-пространственных пред- 
ставлений кривизны (МПК) контуров геометрических объектов позволил выявить 
причины отсутствия выпуклых признаков в таких представлениях. Анализ пред- 
лагаемого для решения этой проблемы дуального МПК выявляет избыточность и 
неадекватность данного представления, однако дает предпосылки возможного 
решения проблемы отображения выпуклых признаков путем проецирования. 

Введенная формулировка межмасштабного проецирования дает возможность 
разработки нового масштабно-пространственного представления формы геометрических 
объектов, включающего и вогнутые, и выпуклые признаки формы. Представление 
формы геометрических объектов с помощью модели межмасштабного пространства 
кривизны обеспечивает наиболее полное отображение признаков формы геометрических 
объектов, что создает предпосылки создания более эффективных методов распоз- 
навания геометрических объектов по признакам формы, позволяя значительно 
расширить класс распознаваемых объектов. 

Планируется проведение широких экспериментальных исследований раз- 
работанной модели на базах геометрических объектов, распознавание которых было 
ранее не возможно либо не адекватно с использованием масштабно-пространственных 
представлений из-за ограничений исходной модели, а также сравнения дескриптора, 
полученного на основе модели, с иными, принятыми в рамках стандарта МРЕС-7. 
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На основе данного теоретического материала, а также опираясь на результаты 
экспериментальных исследований, планируется публикация также и в зарубежных 
научных изданиях. 
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Модель мжмасштабного простору кривизни для представлення форми геометричних 0б’ект!в 
Пропонуеться модель мжмасштабного простору кривизни для представлення форми контурв 
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в1дображае опукл! ознаки форми в масштабному простор! за рахунок введення мжмасштабного 
проектування, що дозволяе значно розширити клас об’ектв, розшзнаваних за допомогою масштабно- 
просторових представлень. 
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